// 此文件用于编译为PTX文件，供Java程序通过JCuda调用

/**
 * 在GPU上执行向量加法运算
 * @param a 输入向量a
 * @param b 输入向量b
 * @param c 输出向量c
 * @param n 向量大小
 */
extern "C" 
__global__ void vectorAdd(const float *a, const float *b, float *c, int n) {
    // 计算当前线程处理的元素索引
    int i = blockIdx.x * blockDim.x + threadIdx.x;
    
    // 确保不会越界
    if (i < n) {
        // 执行向量加法运算
        c[i] = a[i] + b[i];
    }
}